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Sequence Alignment of 48 kD G1 i-antigen 
and 55 kD G5 i-antigen nucleotide sequences 

Gi SEQ ID NO: 1 atgaaatataatattttattaattttaattatttctttatttattaatg^ 
G5 SEQ ID NO: 3 atgaaaaataatattttagtaatattgattatttcattatttatcaattaaattaaat^ 
**** ** *** 

Gl GTTCCATGTCCTGATGGTACTTAGACTCA AGCTGGAT TGACTGATGTAGGTGC 

G5 GCTAATTGTCCTGTTGGAACTGAAACTAACACAGCCGGATAAGTTCA-TGATCTAC^^ 

* * *«*-*«** «** *** * *** * **** *** *•** * 

Gl TGCTGATCTTGGTACTTGTGTTAATTGC-AGACCTAATTTTTACTAT 

G5 TCCT GCAAATTGTGTTAATTGTTAGAAA-AACTTTTATTATAATAATGCTGCTG 

* *• * * ************ *** ** ***** ****** ** ***** 

Gl CirPAAGGAGAAGCTAATGGTAATTAACCTTTCGCAGCAAATAATGCTGCTAGAGCT 

G5 CTT TCGTTCC TGGTGCTAG TACGT 

*** *** * ** ****** ** * 

Gl GTGTACCATG-CCA-AATAAACAGA-GTAGGCTCTGTTACCAA-TGCAGGTG — ACTTAG 

G5 GTACACCTTGTCCATAAAAAAAAGATGCTGGTGCT-TAACCAAATCCACCTGCTACT--G 



Gl CTACTTTAGCCACATAATGCAGTACTTAATGTCCTACTGGCACTGCACTTGATGA 

G5 CTAATTTAGTCACATAATGTAACGTTAAATGCCCTGCTGGTACCGCAATTGCAGGTGGA^ 



Gl TGACAGATGTTTTTG — ATAGATCAGCCGCATAATGTGTTAAATGCAAACCTAACTTTTA 

G5 CAACAGATTATGCAGCAATA-ATCA CAGAATGTGTTAATTGTAGAATTAATTTTTA 

****** * * *** **** ** ********** ** * * *** ***** 

Gl CTATAATGGTGGTTCTCCTTAAGGTGAAGCTCCTGGCGTTTAAGTTT^ 

G5 TAATGA AA ATGCTCC AAATTTTAA 

***** ** * ***** * **** 

Gl TGCCGCTGCAGGTGTTGCTGCCGTTACTAGTTAAT<?rGTACCTTTC 

G5 TGCAGGTG CTAGTACATGCACAGCTTGTCCGGTAAACAGAGT 

******** ***** *** * **** * ****** * 

Gl CGATTCTCCTGCCACTGCAGGT GCCTAAGCTAATTTAGCCACATAATGTAGCAATTA 

G5 TGGTGGTGCATTGACTGCTGGTAATGCC GCTACCATAGTCGCATAATGTAACGTCGC 
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ATGTCCTACTGGCACTGTACTTGATGATGGAGTGACACTTGTTTTTAAT^ 
ATGTCCTACTGGTACTGCACTTGATGATGGAGTAACTACTGATTATGTTAGAT^ 



Gl 
G5 



ATTATGTGTTAAATGCAGACCTAACTTTTACTATAATGGT GGTT CTCCTTA 

AGAATGTK?rrAAATGTAGACTTAACTTTTACTATAATGGTAATAATGGTAATACTC 



Gl 
G5 



AGGTGAA GCTCCTGGCGTTTA 

CAATCCAGGTAAAAGTTAATGCACACCTTGTCCGGCAATTAAACCTGCTAATGTTGCT 



Gl 
G5 



AG TTT TTGC TGCTGG 

AGCTACTTTAGGTAATGATGCTACAATAACCGCATAATGTAACGTTGCATGCCCTGATQG 



Gl 
G5 



TGCT GCCGCTGCAG GTGTTGC 

TACTATAAGTGCTGCTGGAGTAAATAATTGGGTAGCACAAAACACTGAATGTACTAATTC 



Gl 
G5 



TGCCGTTACTAGTTAATGTGT 

TGCTCCTAACTTTTACAATAATAATGCTCCTAATirrCAATCCAGGTAATAGTACATGCCT 



Gl 
G5 



ACCTTGCCAAATAAACAAAAACGATTCTCCTG CCACTGCAGGTGCCTAAGCTAATTT 

ACCTTGCCCAGCAAATAAAGATTATGGTGCTGAAGCCACTGCAGGTGGTGCCGCTACT^ 
• *** *** * ** * *** ************ **** *** 



Gl 
G5 



AGCCACATAATGCAGTACirrAATGTCCAACTGGCACTGCAATT-CAAGACGGAG^ 
AGCCAAATAATGTAATATTGCATGCCCTGATGGTACnXXrAATTGCTAGT -GGAGCAAC — 



Gl TTGTTTTTAGTAAT-TCATCCACATAATGTlCTTAAT-GCATTGCTAATTA C TT' l 
G5 -TAATTAT-GTAATATTATAAACAGAATGT-CTAAATTGTGCTGCTAACTTTTATTT^^ 
* ** « ***** * ** *** ***** ** *** * ****** * * **** * 

Gl TGGTAAT TTCGAAGCAGGTAAAAGTTAATGTTTAAAG — TGTCCAGTAAGTAAAACT 

G5 TGGTAATAATTTCTAGGCAGGAAGTAGTAGATGC — AAAGCATGTCCAGCAAATAAAGTT 

******* *** * ***** * *** *** **** ******* ** **** * 

Gl A CTCCAGCACATGCTCCAGGTAATACTGCTACTTAAGCCACATAATGT TT 

GS TAAGGCGCTGTAGCAA CTGCAGGTGGTACTGCTACTTTAATTGCATAATGTGCCCTT 

** **** ** ***** *********** * ******** ** 

Gl GACCACATGTCCTGCTGGTACAGTACTTGATGATGGAACATCAACTAATT^^ 

G5 GA ATGCCCTGCTGGTACTGTACTCACCGATGGAACAACATCTACTTATAAATAAGC 



Gl cgcaactgaatgtactaaatgttctgctggcttttttgcatca;^^ 

G5 agcatctgaatgtgttaaatgtgctgccaacttttatactacaaaataaactgat^ 



Gl agcaqgtactgatacatgtactgaatgtactaaaaaattaacttctggtgccacagct 
G5 agcaggtattgatacatgtactagttgtaataaaaaattaacttctggcgctgaagctaa 



Gl agtatatgctgaagctactcaaaaag — tataatgcgcctccactactttcgctaaatt 

G5 TTTAC CTGAATCTGCTAAAAAAAATATATAATGTG ATTTCGCTAATTT 



Gl TTTATCGATTTCCTTATTATTTATTTCTTTCTATTTATTG 
G5 TTTATCAATTTCCTTATTATTGATTTCTTATTATTTATTA 
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55 KD i-antigen protein 

10 20 30 40 50 60 

SEQ ID NO: 7 MKNNILVILI ISLFINQIKS ANCPVGTErm TAGQVDDLGT PANCVNCQKN FYYISINAAAFV 

70 80 90 100 110 120 

PGASTCTPCP QKKDAGAQPN PPATANLVTQ CNVKCPAGTA lAGGATDYAA IITBCVNCRI 

130 140 150 160 170 180 

NFYNENAPNF NAGASTCTAC PVNRVGGALT AGNAATIVAQ CNVACPTGTA LDDGVTTDYV 

190 200 210 220 230 240 

RSFTECVKCR USIFYYNGNl^ NTPFNPGKSQ CTPCPAIKPA NVAQATIjGND ATITAQCNVA 

250 260 270 280 290 300 

CPDGTISAAG VNNWVAQNTE CmCAPNFYN NNAPNFNPGN STCLPCPANK DYGAEATAGG 

310 320 330 340 350 360 

AATLAKQCNI ACPDGTAIAS GATNYVIIiQT BCLNCAANFY FDCaJNFQAGS SRCKACPANK 

370 380 390 400 410 420 

VQGAVATAGG TATLIAQCAL ECPAGTVLTD GTTSTyKQAA SECVKCAANF YTTKQTDWVA 

430 440 450 460 470 480 
GIDTCTSCNK KLTSGAEANL PESAKKmQC DFANFLSISL LLISYYLL** 
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GPI-PLC 
P S a-CRD 



55Kd- 




A B C AC 



\y — 

J^ig. 11 
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EQ ID Primers for synthesis of G5 synthetic gene. 

3201: 

70 ATGGGA ATT CAAATCAAGAACAACATCCnX3 (71X3 ATCCTOATC 

TCT GCT AAC TGT CXT GTO GGA ACX: GAG ACC AAC ACC OCT GGA GAG GTC 
3202: 

71 CrcCAG GCA CX5A AAG GAG CAG CGTTGTTCTr ACT AGA AOrTCTTCTGAC AGTTCA CAC AGTTAG GAG GGG 
TTC CC A GGT OCT OCA CCT arc GAG OGG TGT TGG TC 

3203: 

72 CXK:TGCTGCTrr<XTGOCTGGAGCrrcTACCrcTACCXX:TTCT^ 
GOG TAA CCC TCC TGC TAG GGG TAA CCT GGT G 

3204: 

73 GATGATAGCAGCGTAGrrcGarAGCTCCTtX:AGCGATAGGGGTTCCAGGAGGACAC^ 
GGT GAG GAG GTT AGC GGT AGC AGG AG 

3205: 

74 GGT AGG GAG TAG GGT GGT ATC ATC AGC GAG TGT GIG AAG TGT OGG ATC AAC TTC TAG AAG GAG AAG GGT 
GGT AAC TTC AAC GCr GGA GCr TCP AGC TOT AGC GCr TGT OCT GTG AAG GGG GIG GC^ 

3206: 

75 GGTGAAAGAGOGCACGTAGTCGGTGGTCAGTXXGTCGTCCAG AGGGOrTOGGGT AGG ACA AGG CAC GTT 
ACA era AGG GAG GAT GGT AGC AGC GTT TCC AGC GGT GAG AGC TOG TCC GAG GOG 

3207: 

76 GACTACGroCGCTCTTrcAOCGAGTGTGTGAAGTGTOGCCTGAAC TTCTACTAG AACGGA AAC AACGGA 
AAC AGC CCT TTC AAC OCTGGA AAG TCTCAG 

3208: 

77 GTGATGCTAGCGTXX3TrrC0CAGGGTAGa:TGAGCCACGTrAGCAGGCTroATAGCAG^ 
CAC TG A GAG TFT CCA GGG TTC AAA GG 

3209: 

78 GGGAAAOGAOGCTACCATCACCGCTXiZAGTGTAACGTGGCTraTCCTGAaKjAAG^ 
ACT GAA CAA CTG GCT GGG TCA GAA C 

3210: 

79 CAGACAGCTAGAGTrTCCAGGGTrGAAGTrAGGAGCGITGITaiTCTA GAA GTT AGG AGC A 
ACA ore GCT GTT Cro AGC CAC CCA GTT GTT C 

3211: 

80 CGCTGGAAACrcTACCTGTCTGOCTroT0CTGGTAACAAGGACTACGGAGCTGAGGCTACaX:TX3GA^ 
AGC TGC TAG GCT GGG TAA GC 

3212: 

81 GCTCrcCAGGATCACCTAGTrGCTAGCTXXIAGAAGCGATAGGGCTTDCGTCAGGACAAGGGATGrrACA 
CTG err AGC CAG GCT AGC AGC 

3213: 

82 CAACTACCTGATCCTGCAGACCGAGroTCTGAACroTGCTGCTAACrrCTACTrOGAOGGAAACAAC^ 
CCA GGG TGG ATC TTC TCG CTG TAA GG 

3214: 

83 GAGCGATCAGGGTAGOGGTTCCrcCAGOGGTAGOCACAGCTrCCTGCAOCTTCTTAGCAGGACAAG 
TAG AGC GAG AAG ATC CAG OCT GG 

3215: 

84 GAACOGCTACOCTGATOGCTCACTGrocrcTGGACTGTCCrcCTGGAAaXJTGCTGAOCGA 
CCT CTA OCT ACA AGC AGG CTG GTT C 

3216: 

85 GCT GTC GATTCC AGC CAC OCA GTC GCTCTG CITGCTGCTCTA GAA GTT AGC AGC ACA CFTCAC ACA CTC 
AG A AGG AGC cro err CTA GCT AG 

3217: 

86 GGGTGGCTCGAATOGACAOCTCTAOCTCrrCTAACAAGAAGGTGACCTCraGAGCTGAGGCTAAarTGC 
CTG ACT CTG CTA AG A AGA ACA TC 

3218: 

87 GAG GGA TOG TTATTA CAG CAG CTA CTA AGA GAT CAG CAG CAG AGA GAT AGA CAG GAA GTT AGC GAA GT^ 
ACA era GAT GTT err err AGC AGA CT 
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G5 proline mutant 
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10 


4^ 20 


30 


ATGAAGAACA 


ACATCCCX3GT 


GATCCTGATC 


70 


80 


90 


GCTAACTGTC 


CTGTGGGAAC 


OGAGACCAAC 


130 


140 


150 


CCTGCTAACT 


GTGTGAACTG 


TCAGAAGAAC 


190 


200 


210 


CCTGGAGCTT 


CTACCTGTAC 


CCCTTGTCCT 


250 


260 


270 


CCTCCTC3CTA 


CCXXTTAACCT 


GGTGACCCAG 


310 


320 


330 


ATCGCTGGAG 


GAGCTACCGA 


CTACX3CTGCT 


370 


380 


390 


AACTTCTACA 


ACGAGAACGC 


TCCTAACTTC 


430 


440 


450 


CCTGTGAACC 


GTCTQGGAGG 


AGCTCTGACC 


490 


500 


510 


TGTAACGTGG 


CTTCTCCTAC 


CGGAACXX3CT 


550 


560 


570 


CGCTCTTTCA 


CXX3AGTGTGT 


GAAGPTGTCGC 


610 


620 


630 


AACACCXXnT 


TCAACCCTGG 


AAAGTCTCAG 


670 


680 


690 


AACGTGGCTC 


AGGCTACCXrr 


GGGAAACGAC 


730 


740 


750 


TGTCCTGACG 


GAACCATCTC 


TGCTGCTGGA 


790 


800 


810 


TGTACCAACT 


GTGCTCCTAA 


CTTCTACAAC 


850 


860 


870 


TCTACCIX3TC 


TGCCTTGTCC 


TGCTAACAAG 


910 


920 


930 


GCTGCTACCC 


TGGCTAAGCA 


GTGTAACATC 


970 


980 


990 


GGAGCTACCA 


ACTACX5TGAT 


CCTGCAGACC 


1030 


1040 


1050 


TTCGACGGAA 


ACAACTTCCA 


GGCTGGATCT 


- 1090 


1100 


1 1 1 n 


GTGCAGGGAG 


CTGTGGCTAC 


CGCTGGAGGA 


1150 


1160 


1170 


GAGTGTCCTG 


CTGGAACCX5T 


GCTGACCGAC 


1210 


1220 


1230 


TCTGAGTGTG 


TGAAGTGTGC 


TGCTAACTTC 



100 110 120 

3GAC AGGTGGACGA CCTGGGAACC 

160 170 180 

rACA ACAACGCTGC TGCTTTCGTG 

220 230 240 

^AGG ACGCTGGAGC TCAGCCTAAC 

280 290 300 

3TGA AGTGTCCTGC TGGAACCGCT 

340 350 360 

\CCG AGTGTCTGAA CTGTCGCATC 

400 410 420 



460 470 480 

\ACG CTGCTACCAT CX3TGGCTCAG 

520 530 540 

3ACG GAGTGACCAC CXiACTACGTG 

580 590 600 



640 650 660 

rCTT GTCCTGCTAT CAAGCCTGCT 

700 710 720 

\TCA CCGCTCAGTG TAACGTGGCT 

760 770 780 

\ACT GGGTGGCTCA GAACACCGAG 

820 830 840 

3CTC CTAACTTCAA CXXTTCGAAAC 

880 890 900 

3GAG CTGAGGCTAC CX3CTGGAGGA 

940 950 960 



1000 1010 1020 

rCTGA ACTGTGCTGC TAACTTCTAC 

1060 1070 1080 

inXSTA AGGCTTGTCC TGCTAACAAG 

1120 1130 1140 

rACCC TGATCX3CTCA GTGTGCTCTG 

1180 1190 1200 

::acct ctacctacaa gcaggctgct 

1240 1250 1260 



J^ig, 18a 
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1270 1280 1290 1300 1310 1320 

GGAATCGACA CCTGTACCTC TTGTAACAAG AAGCTGACCT CTGGAGCTGA GGCTAACCTG 



1330 1340 1350 1360 1370 1380 

CCTGAGTCTG CTAAGAAGAA CATCCAOTGT GACTTCGCTA ACTTCCTGTC TATCTCTCTG 

1390 1400 1410 1420 1430 1440 
CTGCTGATCT CTTACTACCT GCTG 



Mg. 13b 
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05 proline mutant protein 

1 10 20 30 40 50 60 

SEQIDNO:54 MKNNIFVII.X ISLFINQIKS ANCPVGTETN TAGQVDDLGT PANCVNCQKN FYYNNAAAFV 

70 80 90 100 110 120 

PGASTCTPCP QKKDAGAQPN PPATANLVTQ CI3VKCPAGTA lAGGATDYAA IITBCVNCRI 

130 140 150 160 170 180 

NFYNENAPNF NAGASTCTAC PVNRVGGALT AGNAATIVAQ CNVACPTGTA LDDGVTTDYV 

190 200 210 220 230 240 

RSFITCVKCR liNFYYNGNNG NTPFNPGKSQ CTPCPAIKPA NVAQATLGEND ATITAQCNVA 

250 260 270 280 290 300 

CPDGTISAAG VNNWVAQNTE CTNCAPNFYN NNAPNFNPGN STCLPCPANK EYGAEATAGG 

310 320 330 340 350 360 

AATLAKQCNI ACPDGTAIAS GATOWTLQT ECIUCAANFY FDGNNFQAGS SRCKACPANK 

370 380 390 400 410 420 

VQGAVATAGG TATLIAQCAL ECPAGTV7LTD GTTSTYKQAA SBCVKCAANF YTTKQTDWVA 

430 440 450 460 470 480 
GIDTCTSCNK KLTSGAEANL PESAKKNIQC DFANFLSISL LLISYYLL 
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Mg. 15 
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